大脑通过其复杂的尖峰网络的网络有效地执行非线性计算,但这是如何难以捉摸的。虽然可以在尖峰神经网络中成功实现非线性计算,但这需要监督培训,并且产生的连接可能很难解释。相反,可以用尖峰编码网络(SCN)框架直接导出和理解线性动力系统形式的任何计算的所需连通性。这些网络还具有生物学上的现实活动模式,对细胞死亡具有高度稳健的。在这里,我们将SCN框架扩展到直接实施任何多项式动态系统,而无需培训。这导致需要混合突触类型(快速,慢,乘法)的网络,我们术语乘以乘法峰值编码网络(MSCN)。使用MSCN,我们演示了如何直接导出几个非线性动态系统所需的连通性。我们还展示了如何执行高阶多项式,其中耦合网络仅使用配对乘法突触,并为每个突触类型提供预期的连接数。总体而言,我们的作品展示了一种新的用于在尖峰神经网络中实现非线性计算的新方法,同时保持标准SCNS(鲁棒性,现实活动模式和可解释连接)的吸引力特征。最后,我们讨论了我们方法的生物合理性,以及这种方法的高准确度和鲁棒性如何对神经形态计算感兴趣。
translated by 谷歌翻译
在本文中,我们提出了一种用于在高光谱图像中聚类的新动力学系统算法。该算法的主要思想是,数据点是\``推动\''的方向,该方向是增加密度和最终位于同一密集区域的像素组属于同一类。这本质上是由数据歧管上数据点密度梯度定义的微分方程的数值解。类的数量是自动化的,所得聚类可能非常准确。除了提供准确的聚类外,该算法还提出了一种新的工具,可以理解高维度的高光谱数据。我们在Urban上评估了算法(可在www.tec.ary.mil/hypercube/上获得)场景,将性能与K-Means算法进行比较,使用预识别的材料类作为地面真理。
translated by 谷歌翻译
空中触觉创造了一种新的反馈方式,以使人们能够在空中感觉到触觉。超声波阵列聚焦在空间中的声音辐射压力,以引起由此产生的皮肤偏转的触觉感觉。在这项工作中,我们提出了一个低成本的触觉机器人,以测试空中触觉。通过将桌面机器人组与3D打印的仿生触觉传感器相结合,我们开发了一个可以感知,映射和可视化超声传感器阵列产生的空气触觉感觉的系统。我们通过对各种空气中的触觉刺激进行测试,包括未经调节和调节的焦点来评估触觉机器人。我们将刺激的映射与用于测试空气中触觉的另一种方法的映射:激光多普勒振动法,突出了触觉机器人的优势,包括较低的成本,轻巧的表格因子和易用性。总体而言,这些发现表明我们的方法具有感知空气中触觉的多重好处,并为扩展测试以更好地模仿人触觉感知开辟了新的可能性。
translated by 谷歌翻译
准确的实时流量预测对于智能运输系统(ITS)至关重要,它是各种智能移动应用程序的基石。尽管该研究领域以深度学习为主,但最近的研究表明,开发新模型结构的准确性提高正变得边缘。取而代之的是,我们设想可以通过在具有不同数据分布和网络拓扑的城市之间转移“与预测相关的知识”来实现改进。为此,本文旨在提出一个新型的可转移流量预测框架:域对抗空间 - 颞网(DASTNET)。 Dastnet已在多个源网络上进行了预训练,并通过目标网络的流量数据进行了微调。具体而言,我们利用图表表示学习和对抗域的适应技术来学习域不变的节点嵌入,这些嵌入式嵌入将进一步合并以建模时间流量数据。据我们所知,我们是第一个使用对抗性多域改编来解决网络范围的流量预测问题的人。 Dastnet始终优于三个基准数据集上的所有最新基线方法。训练有素的dastnet应用于香港的新交通探测器,并且在可用的探测器可用时(一天之内)可以立即(在一天之内)提供准确的交通预测。总体而言,这项研究提出了一种增强交通预测方法的替代方法,并为缺乏历史流量数据的城市提供了实际含义。
translated by 谷歌翻译
我们介绍了Smianile过滤仿制学习(QFIL),这是一种用于离线强化学习的新型政策改进操作员。QFIL通过在脱机数据集的过滤版本上运行模仿学习来执行策略改进。过滤过程删除了$ s,其估计的q值低于给定分位于通过从行为策略采样动作引起的值的推送分布。推轴Q分布和产生的值函数分位数的定义是我们方法的主要贡献。我们证明QFIL为我们提供了一种安全的政策改进步骤,函数近似,分位式的选择提供了自然的超参数,以折衷偏差和改进步骤的差异。凭经验,我们执行一个合成实验,说明QFIL如何有效地进行偏差方差权衡,并且我们看到QFil在D4RL基准上表现良好。
translated by 谷歌翻译
深度学习表明,最近在胸部X射线中对异常进行分类方面的成功,但是与自然图像数据集相比,数据集仍然很小。对异常本地化的监督已被证明可以改善训练有素的模型,部分补偿了数据集大小。但是,明确标记这些异常需要专家,并且非常耗时。我们提出了一种潜在的可扩展方法,用于使用眼动物跟踪器收集隐式定位数据,以捕获注视位置和麦克风来捕获报告的概念,从而模仿阅读室的设置。由五位放射科医生标记了所得的反射式(报告和眼睛跟踪数据,用于胸部X射线异常的定位)数据集,并包含3,032个同步的眼球跟踪数据集和时间戳报告的同步集,并从模拟的报告中进行了2,616胸部X射线的转录。 CXR数据集。我们还提供辅助注释,包括围绕肺和心脏的边界框以及由椭圆形成的椭圆形成异常和图像级标签的验证标签。此外,数据的一小部分包含所有放射科医生的读数,从而可以计算评估者分数。
translated by 谷歌翻译
大多数前往离线强化学习(RL)的方法都采取了一种迭代演员 - 批评批评,涉及违规评估。在本文中,我们展示了使用行为政策的政策Q估计来令人惊讶地执行一步的Q估计,从而简单地执行一个受限制/正规化的政策改进的步骤。该一步算法在大部分D4RL基准测试中击败了先前报告的迭代算法的结果。一步基线实现了这种强劲的性能,同时对超公数更简单,更强大而不是先前提出的迭代算法。我们认为迭代方法的表现相对较差是在违反政策评估中固有的高方差,并通过对这些估计的重复优化的政策进行放大。此外,我们假设一步算法的强大性能是由于环境和行为政策中有利结构的组合。
translated by 谷歌翻译
This paper presents a machine learning approach to multidimensional item response theory (MIRT), a class of latent factor models that can be used to model and predict student performance from observed assessment data. Inspired by collaborative filtering, we define a general class of models that includes many MIRT models. We discuss the use of penalized joint maximum likelihood (JML) to estimate individual models and cross-validation to select the best performing model. This model evaluation process can be optimized using batching techniques, such that even sparse large-scale data can be analyzed efficiently. We illustrate our approach with simulated and real data, including an example from a massive open online course (MOOC). The high-dimensional model fit to this large and sparse dataset does not lend itself well to traditional methods of factor interpretation. By analogy to recommender-system applications, we propose an alternative "validation" of the factor model, using auxiliary information about the popularity of items consulted during an open-book exam in the course.
translated by 谷歌翻译
Real-world robotic grasping can be done robustly if a complete 3D Point Cloud Data (PCD) of an object is available. However, in practice, PCDs are often incomplete when objects are viewed from few and sparse viewpoints before the grasping action, leading to the generation of wrong or inaccurate grasp poses. We propose a novel grasping strategy, named 3DSGrasp, that predicts the missing geometry from the partial PCD to produce reliable grasp poses. Our proposed PCD completion network is a Transformer-based encoder-decoder network with an Offset-Attention layer. Our network is inherently invariant to the object pose and point's permutation, which generates PCDs that are geometrically consistent and completed properly. Experiments on a wide range of partial PCD show that 3DSGrasp outperforms the best state-of-the-art method on PCD completion tasks and largely improves the grasping success rate in real-world scenarios. The code and dataset will be made available upon acceptance.
translated by 谷歌翻译
We present Muse, a text-to-image Transformer model that achieves state-of-the-art image generation performance while being significantly more efficient than diffusion or autoregressive models. Muse is trained on a masked modeling task in discrete token space: given the text embedding extracted from a pre-trained large language model (LLM), Muse is trained to predict randomly masked image tokens. Compared to pixel-space diffusion models, such as Imagen and DALL-E 2, Muse is significantly more efficient due to the use of discrete tokens and requiring fewer sampling iterations; compared to autoregressive models, such as Parti, Muse is more efficient due to the use of parallel decoding. The use of a pre-trained LLM enables fine-grained language understanding, translating to high-fidelity image generation and the understanding of visual concepts such as objects, their spatial relationships, pose, cardinality etc. Our 900M parameter model achieves a new SOTA on CC3M, with an FID score of 6.06. The Muse 3B parameter model achieves an FID of 7.88 on zero-shot COCO evaluation, along with a CLIP score of 0.32. Muse also directly enables a number of image editing applications without the need to fine-tune or invert the model: inpainting, outpainting, and mask-free editing. More results are available at https://muse-model.github.io
translated by 谷歌翻译